Например, Бобцов

МЕТОДИКА ДИФФЕРЕНЦИРОВАННОГО НАРАЩИВАНИЯ ЕМКОСТИ СИСТЕМЫ ХРАНЕНИЯ ДАННЫХ С МНОГОУРОВНЕВОЙ СТРУКТУРОЙ 

Аннотация:

Предмет исследования. Предложена методика дифференцированного наращивания емкости хранилища данных, построенная на прогнозной модели временных рядов с оценкой объема поступающего на хранение трафика. Рассмотрено влияние структуры входящего потока данных на выбор модели прогноза. Метод. Система хранения данных формализована в виде матрицы, устанавливающей количество уровней хранения и количество носителей/томов на каждом уровне. Элементами матрицы являются метаданные файлов, которые хранятся на соответствующих носителях/томах многоуровневой системы хранения данных. Матрица визуализирует состояние хранилища данных в виде паттернов. Построение паттернов выполняется с помощью систематических срезов значений матрицы. Периодический анализ паттернов состояния хранилища данных позволяет оценить время достижения предельного значения емкости носителя. Прогнозная модель, положенная в основу методики дифференцированного наращивания емкости хранилища данных, учитывает структуру входящего потока данных. При наличии самоподобной структуры поступающего на хранение трафика реализуется прогнозная модель авторегрессии и проинтегрированного скользящего среднего. Для трафика без самоподобной структуры реализуется общая линейная модель прогноза временного ряда при известных прошлых значениях. Модель прогноза применяется отдельно для каждого носителя/тома уровня хранения. Основные результаты. Приведены особенности структуры трафика, поступающего на хранение. Проверены свойства самоподобия на примере LTE-трафика, демонстрирующие наличие распределений с «тяжелыми хвостами». С помощью модели авторегрессии и проинтегрированного скользящего среднего получены результаты прогноза объема поступающего на хранение трафика. Приведены прогнозные и реальные значения объема трафика, а также величина ошибки прогноза. Разработана методика дифференцированного наращивания емкости системы хранения данных, устанавливающая последовательность шагов анализа паттернов и структуры трафика, поступающего на хранение. Практическая значимость. Методика наращивания емкости хранилища данных учитывает многоуровневую организацию хранения и структуру поступающего потока данных, позволяет организовать дифференцированное наращивание емкости хранилища в соответствии с характеристиками файлов и обеспечением требований к времени гарантированного хранения.

Ключевые слова:

Статьи в номере